{
 "cells": [
  {
   "cell_type": "code",
   "execution_count": 1,
   "metadata": {},
   "outputs": [],
   "source": [
    "import malaya\n",
    "\n",
    "malays = malaya.texts._malay_words._malay_words"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 2,
   "metadata": {},
   "outputs": [],
   "source": [
    "import re\n",
    "from unidecode import unidecode\n",
    "\n",
    "def cleaning(string):\n",
    "    string = unidecode(string).replace('.', '. ').replace(',', ' , ')\n",
    "    string = re.sub('[^\\'\"A-Za-z\\-/ ]+', ' ', string)\n",
    "    string = re.sub(r'[ ]+', ' ', string.lower()).strip()\n",
    "    return string"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 3,
   "metadata": {},
   "outputs": [],
   "source": [
    "# http://rembauboy.blogspot.com/2015/10/perkataan-negeri-sembilan.html\n",
    "\n",
    "additional = \"\"\"\n",
    "angka – suhu badan seperti hendak demam\n",
    "2.      ampai – jemur kain\n",
    "3.      acup – dalam / tenggelam\n",
    "4.      asey – saya\n",
    "5.      alih baro – \n",
    "7.      amba – gulai tidak rasa garam\n",
    "8.      amba-ambaan – kain yang tidak kering atau tidak basah\n",
    "9.   ambek kau - terima padahnya \n",
    "10. arai-arai - pokok bunga yang tidak boleh disuburkan lagi \n",
    "11. aka-aka - dipermain-mainkan\n",
    "1.      berbiri-biri – bertolak-tolakan\n",
    "2.      bumin – gelap gelita\n",
    "3.      bega – degil\n",
    "4.      boleng – bogel\n",
    "5.      bogek – degil\n",
    "6.      bincek – masalah\n",
    "7.      bingit – bising\n",
    "8.      bocek – anak ikan haruan\n",
    "9.      bekecapuih – buat kerja tak cukup masa\n",
    "10.  beketupeh – buat kerja tak cukup masa\n",
    "11.  boda – pukul kuat dengan kayu\n",
    "12.  bengot – rosak ( dented )\n",
    "13.  baeh – baling dengan kayu\n",
    "14.  bersememaian – bertaburan\n",
    "15.  betokak – berkelahi\n",
    "16.  banga – busuk\n",
    "17.  bingai – gila / bodah\n",
    "18.  bonda – anak air\n",
    "19.  buah baru mencelah – buah baru nak masak\n",
    "20.  buah tengah lahat – buah tengah lebat\n",
    "21.  buah dah  teriang – buah dah nak habis\n",
    "22.  bederet-deret – berbaris-baris\n",
    "23.  bepinau – kepala pusing\n",
    "24.  bekerunai – kotor\n",
    "25.  bintat-bintat – kesan gigitan serangga\n",
    "26.  bongka – timbul atau bangun\n",
    "27.  berong – tidak lurus\n",
    "28.  bobot – gemok dan gebu\n",
    "29.  balon – habiskan semua makanan\n",
    "30.  bontuih – kenyang-sekenyangkenyangnya / kenyang dek minum\n",
    "31.  bangang – bodoh\n",
    "32.  basau – lemah / makanan yang lebih tempohnya / basi\n",
    "33.  binawe – perkataan yang bermaksud cacian\n",
    "34.  bingkeh – tercabut / masuk perangkap setelah tertutup\n",
    "35.  bicak – tanah basah dek hujan\n",
    "36.  bincut – bengkak\n",
    "37.  binjek – ambil sedikit makanan dengan jari\n",
    "38.  bok hisap – makan apa sahaja yang dapat\n",
    "39.  batat – pekat dan keras\n",
    "40.  bangka – kayu pokok yang terendam di dalam sungai atau paya\n",
    "41.  buntang – rupa mata yang bulat dan besar\n",
    "42.  boko – makanan seperti wajik atau penganan yang dibawa ke rumah saudara selepas kawin\n",
    "43.  berpondot-pondot  - buah dipokok terlalu banyak seperti betik\n",
    "44.  badi – semangat penyakit\n",
    "45.  belobau – terjatuh ke dalam air\n",
    "46.  bongap – bodoh\n",
    "47.  bodobin – jatuh terhempas ke tanah\n",
    "48.  boseit – libas\n",
    "49.  bosa burak – cakap besar\n",
    "50.  bosulumak – mulut penuh dengan sisa makanan\n",
    "51.  bosulumeh -        sama seperti di atas\n",
    "52.  bongak / mongak – bohong / tipu\n",
    "53.  biaweh – buah jambu kampung yang banyak biji\n",
    "54.  belorak – merasai akan buah yang belum masak, masih muda lagi.\n",
    "55.  berjuntai-juntai – contohnya buah rambai yang terlalu lebat dan memanjang ke bawah\n",
    "56.  berloghrup – dirasai apabila mengunyah buah yang hampir-hampir masak seperti buah jambu batu.\n",
    "57.  berpiong – berpusing\n",
    "58.  berbalau-balau – berbelang-belang / bersinar-sinar\n",
    "59.  belolah – berlari\n",
    "60.  berjelago – kotoran pada pelita minyak tanah\n",
    "61. bonak - bodoh \n",
    "62. bersepah-sepah - terlau banyak bilangannya\n",
    "63. bungko - bodah teramat sangat \n",
    "64. burak - berbual-bual \n",
    "65. bedobet - jatuh dengan kuat\n",
    "66. bodontung - bunyi yang amat kuat \n",
    "67. belum poghopan - belum siap lagi\n",
    "68. bodosing - sakit telinga mendengar akan sesuatu\n",
    "69. bantai kau - lakukan apa yang kau suka\n",
    "70. bedorau - terkejut ( contoh: bodorau darah den )\n",
    "91. bedorau - dah turun ( contoh: hujan dah bedorau )\n",
    "92. bedama - pening dan terdiam ( bedama muke eh!  kena lompang ) \n",
    "93. bersapau - duduk atau tinggal berlama-lamaan di suatu tempat\n",
    "94. bergasak - makan dengan banyak atau buat bersungguh-sungguh\n",
    "95. berangguh - berkumpul sanak saudara di suatu rumah sewaktu perkahwinan \n",
    "96. bangsai - punah atau rosak habis ( rumah moyang eh ! dah bangsai )\n",
    "97. cun melecun - tersangat cantik ( terbit dari percakapan remaja sekarang )\n",
    "98. bonggeng - terdedah\n",
    "99. bongok - bodoh\n",
    "100.bonto - sejenis tumbuhan rendah dalam paya yang menyebabkan badan gatal jika disentuh \n",
    "101.begolek - kenduri besar\n",
    "102.bergolekan - terdapat dengan banyak di atas tanah seperti buah durian yang jatuh waktu malam\n",
    "103.bergolek-gelantang = tinggal di suatu tempat yang dikunjungi seperti rumah sendiri\n",
    "104.berenggeir - tinggal di suatu tempat yang dikunjung seperti rumah sendiri\n",
    "105.beghaghit - bergerak ( malasnya kau ni ! beghaghitlah sikit ).\n",
    "106.bergayut-gayut - buah yang lebat di dahannya .\n",
    "107.bajau - tidak tinggal setempat / baju T\n",
    "108.baning - degil yang teramat sangat\n",
    "109.bayang - seperti hendak tumbang\n",
    "110.bentong - kecil tak mahu besar-besar\n",
    "111.biaweh -jambu batu\n",
    "112.biak - lecah / kawasan air bertakung\n",
    "113.bincau - kecoh sambil marah\n",
    "114.bidik - baling\n",
    "115.binga -pekak\n",
    "116.bobok - air masuk ke dalam mulut dengan banyaknya\n",
    "117.bobek - balut \n",
    "118.becoghabih - banyak cakap\n",
    "119.becoghidau -membising\n",
    "120.bocokak - berkelahi\n",
    "121.bodahagi - susah / leceh\n",
    "122.bodaso - berbaloi\n",
    "123.boghipuk - bertimbun ( kain baju yang bertimbun )\n",
    "124.bodok -  pukul dengan kayu\n",
    "125.boghoghok - bertengkar\n",
    "126.boghojin - naik angin / marah\n",
    "127.bogomunto - bunyi bising\n",
    "128.bojangek - lama menunggu\n",
    "129.bogho - muka merah padam kerana marah atau malu\n",
    "130.boghonjeng - menari-nari\n",
    "131.boghoroman - kain baju yang berlunggunk-lungguk\n",
    "132.bojoman - menunggu terlalu lama\n",
    "133.bojooh - buat kerja ramai-ramai dengan suka ria\n",
    "134.bojonggeng - berjemur\n",
    "135.bokiak - suara kanak-kanak menangis secara beramai-ramai\n",
    "136.bokighah - bergerak\n",
    "137.bokonak - berkumpul anak beranak sebagai persiapan untuk kenduri kawin\n",
    "138.botating - menghidangkan makanan\n",
    "139.bokolelang - sakit yang teramat sangat\n",
    "140.bokotunjang - menahan sakit yang teramat sangat\n",
    "141.bokuak - mengarah orang supaya ke tepi\n",
    "142.bekolintau - berpusing-pusing di tempat yang sama\n",
    "143.bokoludat - keruh atau air berkarat\n",
    "144.bokotupak - bau busuk yang terperangkap\n",
    "145.bokotenteng - terloncat-loncat kerana sakit\n",
    "146.bokotinjah - memijak-mijak sesuatu dengan sesuka hati\n",
    "147.bokotuntang - kelam kabut\n",
    "148.bokotutuih - becok\n",
    "149.bokundo-kundo - bergerak kesuatu tempat beramai-ramai\n",
    "150.bolimpap - kain yang berlonggok dan belum dilipat\n",
    "151.bolo - membersihkan haiwan selepas disembelih\n",
    "152.bolong - bocor yang besar\n",
    "153.bondong - angkut atau punggah\n",
    "154.bonak - bodoh atau bebal\n",
    "155.bonyo - biskut yang direndam terlalu lama di dalam minuman\n",
    "156.bosoka - gula yang berlebihan pada kuih wajik\n",
    "157.bosoko - merayau tanpa tujuan.\n",
    "158.bosolehet - comot / kotor\n",
    "159.bosolopeng - kerak hingus yang melekat di pipi\n",
    "160.bosolopet - najis yang tidak habis dicuci yang melekat di punggung\n",
    "161.bosolepot - duduk atas lantai\n",
    "162.bosomemai - bertaburan\n",
    "163.bosonghayang - bergelandangan\n",
    "164.botenggong - duduk atas batang kayu yang sudah rebah\n",
    "165.botighai - kain yang koyak rabak\n",
    "166.bosolighat - keadaan yang terlalu banyak atau tidak terurus\n",
    "167.bototam - berhimpit-himpit untuk melihat sesuatu yang menarik ( excited )\n",
    "168.bukat - air yang berkeladak\n",
    "169.boepak-epak - berlambak-lambak\n",
    "170.bobenta - berpusing-pusing\n",
    "171.bodamar - perik akibat kena tampar\n",
    "172.bodocit -berbunyi\n",
    "173.bodosup -laju\n",
    "174.boghombik - terlalu banyak\n",
    "175.bolengkar - tidur merata-rata\n",
    "176.bolongging - tidak memakai baju\n",
    "177.bejo-ong - untung besar\n",
    "1.      comporo – mandi lama dan bersuka-sukaan dalam sungai\n",
    "2.      cekadak – perangai\n",
    "3.      capal – selipar\n",
    "4.      cobak – gali\n",
    "5.      cetot – hubungan sex\n",
    "6.      cemat – pukul dengan ranting kayu atau lidi\n",
    "7.      cocokehan – nak cepat\n",
    "8.      cuek – tanamkan / pacakkan\n",
    "9.      ceneke – tidak berlaku jujur\n",
    "10.  cikun – curi\n",
    "11.  cikai – bayaran ke atas sesuatu\n",
    "12.  cucut – sedut air\n",
    "13.  congkot – kesejukan\n",
    "14.  calong – bekas air\n",
    "15.  cebok – bekas air  atau basuh punggung selepas buang air besar\n",
    "16.  chairmay – kosong ( daun trup )\n",
    "17. cupil - di tepi / nyaris jatuh kebawah\n",
    "18. cangap - cabang di hujung buluh untuk mengambil buah \n",
    "19. cegak mata kau - terang mata selepas minum teh \n",
    "20. cuak - takut\n",
    "21. cengini - macam ini ( cengini cara buek eh ! )\n",
    "22. cokau - tangkap ( cokau ayam dalam reban tu ! )\n",
    "23. colek - sentuh ( jangan dicolek dinding yang baru dicat tu ! )\n",
    "24. congkau - capai ( tak tercongkau den den yo ! )\n",
    "25. cun-melocun - tersangat cantik ( terbit dari percakapan remaja sekarang ) \n",
    "26. cembeng - sedih\n",
    "27. cibir - menjelir lidah\n",
    "28. cilut - curi benda-benda kecil\n",
    "29. coghreng - comot\n",
    "30. cobau - tetak\n",
    "31. celait - lampu suluh ( berasal dari BI - touch-light )\n",
    "32. cogholang - mata yang terbuka dan bersinar\n",
    "33. capuk-capuk - bertompok-tompok\n",
    "34. congkuit - pengikut ( followers )\n",
    "35. copot - sejemput / ambil sedikit dengan tangan\n",
    "36. cuci - rosak / punah\n",
    "37. coghuh - lumat\n",
    "38. colungap - makan dengan golojoh\n",
    "1.      dobik – pukul dengan tangan khususnya di belakang badan\n",
    "2.      den – saya\n",
    "3.      debot – gemok\n",
    "4.      dengket – air cetek\n",
    "5.      dompot – pendek\n",
    "6.      dobush – terlepas\n",
    "7.      dogheh – cepat\n",
    "8.      dodat / dudut – minum tanpa gunakan cawan atau gelas\n",
    "9.      dedulu – zaman dahulu\n",
    "10.  dah kelicit luho – sudah masuk zuhur\n",
    "11. digodak - didapatkan atau dicari\n",
    "12. dijujut - ditarik \n",
    "13. dah bungkuih - gagal atau sudah mati \n",
    "14. diruih - curahkan\n",
    "15. dibogolkan - dikumpulkan \n",
    "16. dek ari - disebabkan cuaca panas\n",
    "17. dikenok-kenoknya - seseorang yang mengatakan apa sahaja yang dibuat oleh orang lain semuanya salah belaka. \n",
    "18. dengkot - terhincut-hincut\n",
    "19. diang - memanaskan badan dekat dengan api\n",
    "20. domut - lemah / lembab\n",
    "1.      ensot – bergerak sedikit\n",
    "2.      epong – makan buah tanpa mengupas kulitnya\n",
    "4.   engkoh - mengurus / peduli\n",
    "5.   entaher - mengiyakan sesuatu\n",
    "1.      gana – semata-mata\n",
    "2.      gedempong – terlalu gemok\n",
    "3.      ginco – gaulkan\n",
    "4.      ghuyup – basah kuyup\n",
    "5.      ghoroh – nyawa\n",
    "6.      ghubu – jolok\n",
    "7.      ghobu – putih empuk\n",
    "8.      gunjai – tinggi\n",
    "9.      gundu – tinggi lampai\n",
    "10.  gacik – potong kecil-kecil\n",
    "11.  gobok – tempat menyimpan makanan\n",
    "12.  godak – kacau\n",
    "13.  gombo – pecah-pecahkan tanah\n",
    "14.  goyeh – tiang atau gigi longgar\n",
    "15.  gait – ambil buah dengan kayu\n",
    "16.  ghongak – rosak\n",
    "17.  gaha – gesel\n",
    "18.  golo – dapat masalah / susah\n",
    "19.  ghongkoh – menarik dahan ke bawah supaya buah boleh diambil\n",
    "20.  ghruntun – buah digugurkan sebelum masak oleh kera\n",
    "21.  ghrompong – gigi berlubang\n",
    "22.  godang – besar\n",
    "23.  ghamuih – muka penuh dengan bulu ( hairy )\n",
    "24.  gaysot – potong atau kerat dengan pisau atau gergaji\n",
    "25.  gaywai – pukul dengan benda panjang\n",
    "26.  gayat – orang asli\n",
    "27.  ghombay – tak diperdulikan akan cakap seseorang\n",
    "28.  ghayat – takut akan ketinggian\n",
    "29.  ghemah – sisa makan di atas lantai\n",
    "30.  goba – selimut\n",
    "31.  ghoman – raut muka\n",
    "33.  gelesek – gosok dengan kuat\n",
    "34.  gaynyot – ubi atau buah yang sudah masuk angin / lisut\n",
    "36.  gairbong – disondol lalu dimakan seperti babi memakan ubi kayu\n",
    "37. ghewang - khayal \n",
    "38. ghodah - dibuat / dicari \n",
    "39. ghopoi - hancur\n",
    "40. ghahai - rosak teruk\n",
    "41. gobek - sejenis alat untuk melumatkan sirih ( berasal dari perkataan Inggeris \" go and back \" ) \n",
    "42. gudam - kena hentam ( berasal dari perkataan Inggeris  -  god damn ) \n",
    "43. ghairbeh - tidak terurus \n",
    "44. gasak kau - buat sendiri dan terimalah akibatnya \n",
    "45. gesek - sembelih dengan pisau\n",
    "46. gedobok - besar dan hodoh\n",
    "47. gilan-gilan - pandir\n",
    "48. ghontian - minta maaf ( berasal dari perkataan hentikan  - ghontian takkan dapek dek kau do ? )\n",
    "49. ghinek - tanda-tanda\n",
    "50. ghopang - pangkas / potong \n",
    "51. gabak - koyak atau kehabisan\n",
    "52. geboih - terlalu besar\n",
    "53. ghembat - bergaduh / baling sesuatu ke dinding / dicuri orang\n",
    "54. ghembeh - sejenis cangkul / tajak\n",
    "55. ghobeh - hujan renyai\n",
    "56. gombeh - mengada-ngada keterlaluan\n",
    "57. ghopeh - makan\n",
    "58. ghosan - hampir basi\n",
    "59. ghenceh - makhluk yang kononnya memotong kepala untuk takutkan kanak-kanak\n",
    "60. ghinso - badan rasa tidak selesa kerana panas atau tidak mandi\n",
    "61. ghopong - alat ditiup untuk menghidupkan api\n",
    "62. godek - kacau\n",
    "63. gelemey - lemak pada daging lembu\n",
    "64. gomeng - kelapa yang tiada isi / menggoyangkan kepala\n",
    "65. ghepeng - penyek\n",
    "66. gaduh -risau\n",
    "67. golo dek eh - susahlah macam ini\n",
    "68. gheha - tempat meletakkan al-quran untuk dibaca\n",
    "1.      hobin – pukul\n",
    "2.      hulu-hala – tidak tentu arah kerana dahaga\n",
    "3.      hamput – memarahi\n",
    "4.      hoga – menggoncang pokok supaya buah gugur\n",
    "5.      hurai – buka dan taburkan\n",
    "6.      hongeh – penat berjalan / makan terlalu banyak\n",
    "7.      hampeh – tak berguna\n",
    "8.      hapah – apapun tiada\n",
    "9.      humang ai !  -  kagum akan sesuatu\n",
    "10.  herot – tidak lurus\n",
    "11.  haram – tidak melakukan permintaan atau arahan seseorang\n",
    "12. hadang - halang atau penghalang\n",
    "13. hunjam - jalan sejauh-jauhnya dengan sepenuh tenaga\n",
    "14. hapik - tidak diperdulikan\n",
    "15. hati kaudu - sangat busuk hati\n",
    "16. hojan - teran / meneran\n",
    "17. humbeh - gasak / bantai\n",
    "18. hapak - busuk\n",
    "\n",
    "     I\n",
    "1.      ibu sako – generasi tua\n",
    "2.   imbeh - urus / layan\n",
    "\n",
    "     \n",
    "      J\n",
    "1.      jongkeh – mati keras / ketawa bagai nak rak\n",
    "2.      jongkit - degil   \n",
    "3.      jobo – tidak tahu malu\n",
    "4.      jobak – perangkap burung\n",
    "5.      Jibam – nama orang tempatan\n",
    "6.      joghan – serik\n",
    "7.      jogheh – buat penat\n",
    "8.      joki – rezeki\n",
    "9.      jigat – kaku kerana  menangis\n",
    "10. juang kail - joran pancing \n",
    "11. jadah - faedah ( contoh: apa jadah eh ! )\n",
    "12. jorang air - masak air \n",
    "13. juntang-kalang - dalam keadaan yang tidak kemas dan tersusun, \n",
    "14. jalang - cair / tidak pekat\n",
    "15. jamba - dulang\n",
    "16. jingang - terpinga-pinga\n",
    "17. joghan - serik\n",
    "18. jokin - teramat yakin\n",
    "19. judu - pasangan\n",
    "20. jujut - ditarik\n",
    "21. junujanah - mereka / mereka cerita \n",
    "\n",
    "    K\n",
    "1.      koka – kacau padi yang dijemur supaya cepat kering\n",
    "2.      kolokai – habis semua\n",
    "3.      kono losang – kena sengat\n",
    "4.      kenairneng – tidak tentu arah\n",
    "5.      koghopai – bakul\n",
    "6.      ketuntang – tak duduk diam\n",
    "7.      ketenteng – jalan dengan satu kaki\n",
    "8.      kompot – kudong\n",
    "9.      ketot – pendek\n",
    "10.  kola – potong daging ikan atau daging secara berbaris-baris\n",
    "11.  kuti – cubit dengan jari\n",
    "12.  kelilau – tidak tentu arah\n",
    "13.  kluklaha – tidak tentu arah kerana pedas\n",
    "14.  koporit – terlalu nakal ( berasal dari perkataan Inggeris – culprit )\n",
    "15.  kepiting – kedekut\n",
    "16.  kirap – buang atau tuang air ke dalam longkang\n",
    "17.  kopok – tempat menyimpan padi \n",
    "18.  kongkang – duduk di atas bahu orang yang bergerak\n",
    "19.  kuak – ketepikan\n",
    "20.  kubeh – putih atau cerah\n",
    "21.  kepantangan – pantang sekali \n",
    "22.  kelibat – bayang seseorang\n",
    "23.  kirai kain – goyangkan kain\n",
    "24.  kobeh – curi / upacara berubat\n",
    "25.  kelimbek – bayangan seseorang\n",
    "26.  koting – bahagian kaki dari  lutut ke bawa\n",
    "27.  kelihar sedikit – lega sedikit\n",
    "28.  komat – kena ilmu\n",
    "29.  kisai – mengganggu lipatan kain / bertaburan\n",
    "30.  kopam – kehitaman kerana dah lama tak basuh\n",
    "31.  kelolong – suka buat bising\n",
    "33.  kecoloan – tidak dapat menutup malu / kantoi\n",
    "34.  kolinggoman – geli melihat akan sesuatu seperti ulat\n",
    "35.  kataden – saya berkata\n",
    "36.  katakau – kamu yang berkata\n",
    "37.  keirbok – ketepikan\n",
    "38.  konit – kecil\n",
    "39.  kocet – poket\n",
    "40.  kochik – kecil\n",
    "41.  koman – ketinggalan zaman ( berasal dari perkataan Inggeris  - common )\n",
    "42.  kitai – kibas\n",
    "43.  kenceng – kenyit\n",
    "44.  kotomeneh – ragam\n",
    "45.  kainsal – tuala mandi\n",
    "46.  kelompong – kosong\n",
    "47.  kolopong – ondeh-ondeh / buah Melaka\n",
    "48.  koyok – sombong\n",
    "49.  koleh – keluarkan isi durian dari bijinya untuk dibuat tempoyak\n",
    "50.  koghroh – dengkur\n",
    "51.  keirpok – lentur atau bengkokkan\n",
    "52.  kederek kebaruh – merayau-rayau dari rumah ke rumah\n",
    "53.  kaba – pati kelapa perahan kedua dan ketiga\n",
    "54.  kuih-kuihkan – ketepikan\n",
    "55.  kohok – busuk / niat buruk\n",
    "56.  kobok – mengambil lauk dengan tangan, sepatutnya dengan sudu ketika makan\n",
    "57.  kebagroh – hala ke bawah\n",
    "58.  kederek – hala ke atas\n",
    "59.  kicak – meminta kerana tidak malu\n",
    "60. kalang - empangan atau sekatan\n",
    "61. keladak - kotoran di dalam air \n",
    "62. kopek - ketiak / buah dada wanita\n",
    "63. kupek - buka atau belah buah-buahan \n",
    "64. kandar - pikul \n",
    "66. keluneh - kecil\n",
    "67. kompuih - bertambah kecil / menjadikan perut bertambah kecil\n",
    "68. kame - uli / bancuh dengan tangan\n",
    "69. karang - selepas ini\n",
    "70. kawan - suami atau isteri\n",
    "71. kayu berakal - membuat persiapan untuk kenduri kahwin\n",
    "72. kemot - kemek\n",
    "73. kenen - mengurat anak dara orang / nak dijudukan\n",
    "74. kepeh - basah kuyup\n",
    "75. kepet - kempis / tidak gebu \n",
    "76. kecet - tiada biji\n",
    "77. keset - biji yang kecil\n",
    "78. kilit - kelecek bola\n",
    "79. kitai - libas / kibas\n",
    "80. kobok - ambil sesuatu di tempat yang dalam tanpa melihatnya\n",
    "81. koghobong - ambil makanan tanpa menggunakan sudu\n",
    "82. koghomau / koghomuih - ramas atau cakar kerana marah\n",
    "83. koghajat - juadah\n",
    "84. koghuntong / kuntong - bekas untuk mengisi ikan di pinggang semasa menjala\n",
    "85. kokhoghrek - baki  makanan yang tinggal sedikit.\n",
    "86. kolapo - mencabahkan biji benih\n",
    "87. kolayak - diterbangkan oleh angin\n",
    "88. kelemot - tidak licin atau tidak rata\n",
    "89. kolikanak - pintu dari ruang tengah rumah menuju ke dapur\n",
    "90. kololong - kesakitan akibat terkena benda panas\n",
    "91. kolompong - buah tiada isi dimakan tupai\n",
    "92. kolongkiak - sejenis serangga yang menggigit dari jenis anai-anai\n",
    "93. kolopo - dikebas / dilesang / diserang oleh ayam\n",
    "94. koluhum - umum / pukul rata\n",
    "95. kolenset - pukul / lipat ke atas / tanggalkan kulit ayam selepas disembelih\n",
    "96. kolokati - kacip pinang\n",
    "97. kolosar - buat kerja tidak cermat\n",
    "98. kelimbahan - air bertakung di belakang dapur tidak mengalir dan berbau busuk.\n",
    "99. kolutong / koghutong - kerumun\n",
    "100.kelimbuaian - perangai tidak senonoh / tidak tahu ditegah orang\n",
    "101.komap - terdiam / tergamam\n",
    "102.komat - tarikan / terkena ilmu orang / terkena gula-gula\n",
    "103.koghumuih - menghurung\n",
    "104.koliha - kelaparan\n",
    "105.komeh - menghabiskan nasi atau lauk\n",
    "106.kopam -hitam / kotor\n",
    "107.kosan eh  - rupanya\n",
    "108.kosompokan - terjumpa secara tidak sengaja\n",
    "109.ketulahan - badi / sumpahan\n",
    "110.kua - kacau nasi supaya masak serata\n",
    "111.kucung -balut / balutan\n",
    "112.kudap - makan\n",
    "113.kuei - pondok tempat simpan padi / kepok\n",
    "114.kumam - mengulum makanan\n",
    "115.kutak-katik - buat ikut suka\n",
    "116.kuyo - sejenis hama putih yg melekat di celah kacang panjang dan lain-lain\n",
    "\n",
    "\n",
    "\n",
    "\n",
    "\n",
    "    L\n",
    "1.      likat – pekat\n",
    "2.      leyteng – jentik telinga dengan jari\n",
    "3.      lapun – makan tanpa izin atau sekenyang-kenyangnya\n",
    "4.      lenyek pisang – hancurkan pisang untuk buat kueh\n",
    "5.      lunyah – dipijak\n",
    "6.      lurut – dipisahkan dari tangkainya\n",
    "7.      lobuk-lobak – jatuh dengan banyaknya\n",
    "8.      longkeh – tanggal\n",
    "9.      lelan – hayal / leka\n",
    "10.  logar – hantukkan\n",
    "11.  locut – baling dengan batu / cabut lari\n",
    "12.  lugeh – tumbuk dengan tangan dari arah bawah\n",
    "13.  lompa – anjung rumah\n",
    "14.  layo – salai\n",
    "15.  layoh – lemah\n",
    "16.  lutap – makan dengan cepat\n",
    "17.  lohong – bodoh / besar / barai\n",
    "18.  longjan – terlalu penat berjalan ( berasal dari perkataan Inggeris – long journey )\n",
    "19.  lontung – langgar\n",
    "20.  lokok – curam / berlubang\n",
    "21.  lolok – makan dengan banyak dan cepat\n",
    "22.  lopok – tampar\n",
    "23.  lopok- lopak – bunyi seperti orang berkelahi\n",
    "24.  licih – potong halus-halus\n",
    "25.  lobo – lepaskan / benamkan / masukkan\n",
    "26.  luruh – buang bisa dari badan pesakit / daun atau buah habis gugur\n",
    "27.  lombong – pinggan yang lekok ke dalam\n",
    "28.  layot – tua / rendah atau ke bawah\n",
    "29.  lumu – dipalitkan muka dengan sesuatu\n",
    "30.  lunyai – rosak / hancur\n",
    "31.  locit – membuang selemur dari hidung\n",
    "32.  locot – lebam terkena panas / melecur\n",
    "33.  longot – kotor\n",
    "34.  lontung-lontang –bunyi yang teramat bising\n",
    "35.  longuk-longak – keadaan yang terlalu teruk  seperti jalan raya\n",
    "36.  losang – disengat oleh serangga / penangan seseorang\n",
    "37.  leweh – lemah / tawar\n",
    "38.  lunggah – dilanggar ( bulldoze )\n",
    "39.  lokek – kedekut\n",
    "40.  loghoi – hancur\n",
    "41.  loteng – bilik di tingkat atas ( perkataan Hokien )\n",
    "42.  loleh – potong atau kerat daging\n",
    "43.  longkung-longkang – bunyi seperti orang sedang membuat kerja\n",
    "44.  lilih – potong dengan pisau\n",
    "45. lari larau - sesuatu yang tidak tepat dan berubah-ubah sepergi ketika menyanyi\n",
    "46. lompung - tampar / pukul \n",
    "47. langsai - selesai segala hutang\n",
    "48. longang - tiada orang di sana \n",
    "49. luak - berkurangan \n",
    "50. licau - kehabisan\n",
    "51. lapek - alas\n",
    "52. lagu - perangai atau cara ( mungkin ditiru dari bahasa utara Semenanjung )\n",
    "53. lomau - sudah masuk angin khususnya biskut\n",
    "54. lungguk - kumpul atau simpan ( dah lamo den lungguk duit ni nak ke mekah ! )\n",
    "55. losulosau - bunyi seperti sesuatu bergerak pantas di dalam semak\n",
    "56. lisot - buah yang masak belum cukup tempohnya\n",
    "57. ligat - gasing yang berpusing dengan lajunya\n",
    "58. lompung-lompang - berbagai bunyi kedengaran yang teramat bising. \n",
    "59. lulo - dimakan secara menelan dan tak payah dikunyah  \n",
    "60. loho - menjadi besar kerana selalu digunakan\n",
    "61. landung - sepak\n",
    "62. laghah - buruk\n",
    "63. langgai - tempat membakar lemang\n",
    "64. lanteh - tembus\n",
    "65. lantung - tersangat  busuk\n",
    "66. lecok - coret\n",
    "67. lele ( tolele ) - cuai\n",
    "68. leweh - lemah\n",
    "69. lobong  - berlubang\n",
    "70. locun - basah kuyup\n",
    "71. lodoh - lumat / hancur\n",
    "72. logat - menangis sampai tak keluar suara\n",
    "73. lohong - berlubang yang sangat besar\n",
    "74. lompa - beranda rumah\n",
    "75. lonco - putus tunang\n",
    "76. longit - kalah main\n",
    "77. lonjap - basah\n",
    "78. lotong - kotor\n",
    "79. lontuih - panggilan untuk budak degil\n",
    "80. lueh - muntahkan\n",
    "81. lukuih - basah dek peluh\n",
    "82. lulut - selut / lumpur\n",
    "83. lukuk - ketuk kepala dengan jari\n",
    "84. luncuih - tirus\n",
    "85. luyu - mengantuk\n",
    "\n",
    "\n",
    "    M\n",
    "1.      meghasai – merana\n",
    "2.      memboko – terpinga-pinga\n",
    "3.      memancak-mancak – bersilat-silat\n",
    "4.      melanush – nasi penuh dengan kuah \n",
    "5.      mengoning – perut buncit\n",
    "6.      menyungko - jatuh tertangkup\n",
    "7.      mengeletek – mengelupur\n",
    "8.      mengugu – menangis tak berhenti-henti\n",
    "9.      menopong – pecah\n",
    "10.  mendobut – lari dengan pantas\n",
    "11.  mantai – sembelih lembu\n",
    "12.  mengoreh – gugur\n",
    "13.  monung – termenung\n",
    "14.  mengelopai – mengelupur\n",
    "15.  menteneng – terlalu kenyang sehingga nampak perut\n",
    "16.  melengkar – tidur macam ular\n",
    "17.  melangsit – tidur terlalu lama \n",
    "18.  mencerabih – cakap tidak tentu arah\n",
    "19.  mencangut-cangut – seperti nyawa-nyawa ikan\n",
    "20.  megrombik – terlalu banyak seperti ulat\n",
    "21.  mada – tidak dapat atau pandai belajar\n",
    "22.  memburan – buang air besar\n",
    "23.  melopong – memandang kosong ke arah sesuatu\n",
    "24.  menyelansang – memarahi\n",
    "25.  meghomut – banyak seperti semut\n",
    "26.  membibih – terlalu banyak air yang keluar\n",
    "27.  melahu – merayau\n",
    "28.  merambu – merayau\n",
    "29.  menajo – kail cucuk\n",
    "30.  menderu-deru – terlalu ramai\n",
    "31.  mengambur – cuba keluar dari bekas seperti ikan\n",
    "32.  meloncek – melompat \n",
    "33.  membobok – air keluar terlalu banyak\n",
    "34.  meladung – nasi penuh dengan kuah\n",
    "35.  melanguk – ke sana ke mari tanpa tujuan\n",
    "36.  monggo – membakar sesuatu\n",
    "37.  moghron – membakar sampah\n",
    "38.  mentedarah – makan dengan lahapnya\n",
    "39.  mencicit –  melarikan diri dengan pantas seperti tikus atau tupai\n",
    "40.  mencelinap – hilang dengan cepat seperti arnab\n",
    "41.  mengelintin – melompat-lompat kerana kesakitan\n",
    "42.  membuto – tidur tidak kira masa\n",
    "43.  mencurek-curek  – air keluar tidak henti-henti\n",
    "44.  mengengkot – kesejukan\n",
    "45.  menghengkoh – membawa barang berat\n",
    "46.  memek – lembik ( nasi ini memek )\n",
    "47.  mencelungap – mencuri makanan seperti kucing\n",
    "48.  mencikun – mencuri\n",
    "49.  mencanak – lari atau jalan laju tanpa menoleh ke belakang\n",
    "50.  mentanau – makan sehingga tegak seperti burung tanau\n",
    "51.  menconcong – berjalan sendirian tanpa memperdulikan orang lain\n",
    "52.  meladus – merokok\n",
    "53.  muak – jemu\n",
    "54.  mangga – pelepah kelapa\n",
    "55.  melambak-lambak  -  menunjukkan banyak\n",
    "56.  melolong – menangis sekuat-kuatnya\n",
    "57.  menitih – air terkeluar sedikit demi sedikit di bawah periuk\n",
    "58.  mendosut – memandu dengan laju\n",
    "59.  mohdoreh – mari cepat\n",
    "60.  mencocoh – tersangat penas\n",
    "61.  marin – hari itu / kelmarin\n",
    "62.  membaysey – kerap membuang air kecil\n",
    "63.  mencieh-cieh  - berpeluh-peluh\n",
    "64.  mendhorak – ramai atau banyak\n",
    "65.  mengeliat – regangkan badan khususnya selepas tidur\n",
    "66.  menonoi – kudis atau luka yang bernanah dan sakit\n",
    "67.  menjoram – bunyi motor terlalu buat\n",
    "68.  mencipan – menghilangkan diri dengan pantas seperti lipan\n",
    "69.  memandai-mandai – buat-buat pandai\n",
    "70.  melayot-layot – buah rambutan contohnya terlalu lebat sehingga boleh dicapai tangan\n",
    "71.  menaga koghroh eh – berbunyi dengkurnya\n",
    "72.  memboyot – perut yang besar\n",
    "73.  mencirit – suatu cacian / punggung\n",
    "74.  membaning – berjalan di tengah panas tanpa baju\n",
    "75.  mamai – nyanyok\n",
    "76.  moyok – sakit\n",
    "77.  motan – penting  ( berasal dari perkataan Inggeris Important )\n",
    "78. melingkup - menghilangkan diri atau berambus\n",
    "79. menggagau - kelam-kabut\n",
    "80. monceh-monceh - yang kecil-kecil atau kurang penting \n",
    "81. melempeng - tidak boleh digunakan / keadaan sangat teruk \n",
    "82. mujor - bernasib baik\n",
    "83. melehet-lehet  - sesuatu yang melekat di sana sini\n",
    "84. mengelebeh - kulit manusai yang suatu ketika  tegang sekarang dah menjadi kendur \n",
    "85. mengairlor - terlalu panjang\n",
    "86. menodah - buang masa di suatu tempat\n",
    "87. meghaban - pergi entah ke mana\n",
    "88. memalam - waktu malam \n",
    "89. menyeghingai - menyelongkar \n",
    "90. melaircet - bahagian kaki yang bengkak memakai kasut terlalu lama\n",
    "91. mogang - berkumpul dan menjamu selera beberapa hari sebelum masuk tarikh  berpuasa \n",
    "92. menongah - jalan ke tengah tanpa memperdulikan orang lain\n",
    "93. moh doghreh - mari atau pergi cepat\n",
    "94. melaghram - berlawa-lawaan\n",
    "95. melancur - watery stools ( najis air )\n",
    "96. makan ombong -  boleh melakukan sesuatu yang disuruh orang yang diri merasa bangga\n",
    "97. melancar - menghafal\n",
    "98. membana - tidur sepanjang hari\n",
    "99. manjangan - kepala pengamal ilmu hitam yang terbang waktu malam mencari mangsa\n",
    "100. melilau-lilau - berjalan tidak tentu halatuju\n",
    "101. mekasi - terima kasih ( terbit dari percakapan remaja sekarang )\n",
    "102. mangkin - menjadi ( tapai yang kau buat itu tak mangkin )\n",
    "103. mangai - uh mang eh ! ( expresi terkejut akan kehebatan sesuatu )\n",
    "104. melantak - makan sebanyak yang mungkin \n",
    "105. mensiang - sejenis tumbuhan tinggi dalam paya yang menyebabkan badan gatal jika disentuh\n",
    "106. mengumbo-ngumbo - membesar dengan cepat / api membesar dengan cepat\n",
    "107. melesa -  bahagian bawah kain yang mencecah tanah\n",
    "108. melonto-lonto - dahan pokok yang condong ke bawah kerana terlalu banyak buah.\n",
    "109. menginding-ngiding - menghampiri untuk tujuan meminta sesuatu\n",
    "110. menebeng-nebeng -  menghampiri untuk tujuan mendapatkan sesuatu juga.\n",
    "111. menyampah - meluat / benci akan sesuatu\n",
    "112. manai - badan tidak sihat / lemah\n",
    "113. menjala - tidur kekenyangan seperti ular\n",
    "114. meleweh - pokok kepala tidak lagi berbuah dengan banyaknya\n",
    "115. melampuh - terlalu banyak khususnya buahan\n",
    "116. meong - kuat merajuk / otak berapa betul\n",
    "117. moncongak / tercangok - duduk tanpa tujuan\n",
    "118. monghahang - melalak\n",
    "119. moghahau - bercakap kuat-kuat\n",
    "120. moghelo - panjang\n",
    "121. moghewai - berjalan yang tidak lurus\n",
    "122. monghungap - keadaan nafas yang keletihan\n",
    "123. moghanduk - mengharung air\n",
    "124. mengeban - menjela-jela\n",
    "125. monghungap - mengah\n",
    "126. moghogheh - benda-benda seperti daun atau rambut berguguran\n",
    "127. moghonggoh - pergi ke suatu tempat beramai-ramai\n",
    "128. moghoning - bengkak kemerah-merahan\n",
    "129. moghonyok - merajuk\n",
    "130. moghosit - mengunyah makan ringan\n",
    "131. moghotul - tukul besi\n",
    "132. moghumbo-ghumbo - keadaan api marak dan menjulang-julang\n",
    "133. moghuboi - rambut panjang yang tidak terurus\n",
    "134. mogun - termenung\n",
    "135. molampa - bertaburan\n",
    "136. melampuh - terlalu banyak\n",
    "137. molondut - melayut / kendur\n",
    "138. melehet - hingus yang mengalir di pipi\n",
    "139. molongoh - menangis berpanjangan\n",
    "140. molaghah - buah-buahan yang gugur tidak berkutip \n",
    "141. molayau / moleyak - keadaan air yang melempah ke atas lantai\n",
    "142. molesa - kain yang labuh sehingga mencecah lantai\n",
    "143. melese - suka duduk dekat-dekat dengan orang lain\n",
    "144. moluha / molaha - kepedasan\n",
    "145. molukah - perempuan yang suka duduk terkangkang\n",
    "146. molunggun - bertimbun\n",
    "147. momboko - terlepas sesuatu peluang / padan muka\n",
    "148. mombumbung - pergi entah ke mana\n",
    "149. membungkam - tidur\n",
    "150. memepe - bunyi suara yang sumbang dan sakit telinga\n",
    "151. mompulon - jatuh\n",
    "152. monabe - tumpah / berciciran\n",
    "153. monabir - darah yang banyak akibat luka\n",
    "154. moncamek - benci sangat\n",
    "155. moncoghidau - becok\n",
    "156. moncolongo -harum\n",
    "157. monculin - lari yang teramat laju\n",
    "158. mondahagi / bedahagi - susah diajak berbuat sesuatu\n",
    "159. mendaghek - temberang / cerita yang tak masuk akal\n",
    "160. meneneng - sakit berdenyut\n",
    "161. mengicak - meminta-minta\n",
    "162. mengirap - naik darah\n",
    "163. monghorik-hoghik - menyanyi atau bercakap sampai ternampak urat leher\n",
    "164. mongokeh   kais seperti ayam\n",
    "165. mengelintau - mencari sesuatu dengan perasaan cemas\n",
    "166. mongolesah / mongolusuh - gelisah / duduk tak diam\n",
    "167. monghonggang - bernafas dengan laju kerana keletihan\n",
    "168. mongolinjang - terlompat-lompat kerana gembira\n",
    "169. mongolujut - menggigil kerana keletihan\n",
    "170. mengumba - berpatah balik\n",
    "171. monogoh - jalan pergi dan datang dengan segera\n",
    "172. menonong -berjalan pantas tanpa lihat kiri dan kanan\n",
    "173. montegheh - perut yang kekenyangan\n",
    "174. montibang - tak tau pergi ke mana\n",
    "175. monueng - mengekor ke mana orang pergi\n",
    "176. monugheh - tahu\n",
    "177. monyisik - menyelongkar sama dengan monyoleme\n",
    "178. monyolangsang - bertandang ke rumah orang\n",
    "179. monyongit - bau busuk dari badan\n",
    "180. monyopak - makan berbunyi\n",
    "181. monyonggau - rasa pedas atau kepanasan\n",
    "182. menyungkam - jatuh tersadung dengan muka ke bawah\n",
    "183. menjeje - panjang, melele atau menitik\n",
    "184. merengkeh - keadaan oarang yang membawa bebanan berat\n",
    "185. morengkoh / moghengkeh - keadaan berat bawa beban\n",
    "186. manjang rugi - sentiasa rugi.\n",
    "187. menghayau - dipenuhi air\n",
    "188. mak datok - sungguh hairan\n",
    "\n",
    "\n",
    "\n",
    "\n",
    "    N\n",
    "1.      nonggok – duduk bersahaja\n",
    "2.      nangnga – pandanglah\n",
    "3.      nasi membubu – nasi penuh sepinggan\n",
    "4.      ngirap – marah\n",
    "5.      ngungkit – membawa cerita lama menyebabkan  kemarahan\n",
    "6.      ngarit – bergerak melakukan sesuatu\n",
    "7.      ngosit – makan benda ringan sedikit demi sedikit\n",
    "8.      ngoca – tangkap ikan dengan jeramak ( jala kecil )\n",
    "9.      noneh – nanas\n",
    "10.  ngok atau ngong  - bodoh ( ngong berasal dari perkataan Hokien )\n",
    "11. nyuruk-nyuruk - sejenis permainan kanak-kanak ( hide and seek )\n",
    "13. naik minyak - marah atau mengada-ngada\n",
    "14. nijam - masa ini ( terbit dari percakapan remaja sekarang )\n",
    "15. ngonyei - memakan sesuatu sepertu kuaci secara perlahan-lahan\n",
    "16. ngosey - memakan sesuatu sepanjang waktu  \n",
    "17. nekmoyang sodap eh ! - tentang makanan yang terlalu sedap ( extremely )\n",
    "18. nangoi - anak babi\n",
    "19. ngisai - buat sepah / selongkar\n",
    "20. ngongilanan - buat perangai gila-gila bahasa\n",
    "21. nompan - sepadan / bergaya / sesuai\n",
    "22. nunuk-nanak - terkejar ke sana ke sini dengan pantas untuk mendapatkan sesuatu\n",
    "23. nyaghi - makan sahur ( untuk puasa )\n",
    "24. nyinggah - kena / dapat \n",
    "25. nokoh - sepadan atau sesuai\n",
    "\n",
    "    O\n",
    "1.      okap – tamak\n",
    "2.      onap – mendap\n",
    "3.      ompong – bodoh\n",
    "4.      onceh-onceh – yang tidak penting / remeh\n",
    "5.      ongap – nafas\n",
    "6.      obush – pastikan\n",
    "7.      otuih – tapis / biarkan mendap\n",
    "8.      ontok-ontok – duduk diam-diam\n",
    "9.      onyang – moyang\n",
    "10.  oma – buah yang rosak atau empuk kerana terjatuh dari pokok yang tinggi\n",
    "11. ompuk - lembut\n",
    "12. osel - gunakan wang simpanan sedikit demi sedikit sehingga habis\n",
    "13. olek - kenduri besar\n",
    "14. osah - benarkah ? ( osah kau tak do duit ni ? )\n",
    "15. ocup / acup - tenggelam\n",
    "16. oghuk - bising\n",
    "17. ongeh - mengah\n",
    "18. ongkoh - iras ( rupa )\n",
    "19. \n",
    "\n",
    "    P\n",
    "1.      pelakong – pukul\n",
    "2.      pojo – hujan lebat\n",
    "3.      pengoring – semangat\n",
    "4.      pelaso / poloser – pemalas\n",
    "5.      pioh – pulas\n",
    "6.      pewai – tua gayot, longlai, penat,  letih\n",
    "7.      peletok – patahkan\n",
    "8.      pirek-pirek – pisahkan biji padi dari tangkainya / tenyeh / lunyah \n",
    "9.      polak – panas / jemu\n",
    "10.  pengka – jalan tidak betul kerana sakit\n",
    "11.  perut tebuseh – perut terkeluar kerana gemuk\n",
    "12.  peicok – tidak lurus\n",
    "13.  peluto – kuat pembohong\n",
    "14.  pauk – tetak\n",
    "15.  pongolan – buluh untuk menggait buah / galah\n",
    "16.  peteng – tenguk atau perhati sebelum menembak ( aim )\n",
    "17.  pororok – dipergaduhkan\n",
    "18.  porokeh – hadiah wang\n",
    "19.  punat – pusat / bahagian paling penting\n",
    "20.  puga – jolok atau masukkan ke dalam mulut sesuatu makanan / sumbatkan\n",
    "21.  penampa – lempang\n",
    "22.  pokok kek kau – suka hati kamu\n",
    "23.  polosit – nakal / jahat / sejenis belalang akuan orang\n",
    "24.  pencalit api – macis api\n",
    "25.  pangkin – tempat duduk-duduk ( perkataan Hokien )\n",
    "26.  poghan – bahagian di tepi atap di dalam rumah yang boleh disimpan barangan.\n",
    "27.  poi – pergi\n",
    "28.  penyogan – pemalas\n",
    "29.  porak – kawasan kecil yang berpagar di tepi dapur  untuk menanam keperluan memasak\n",
    "30.  piun - posman\n",
    "31. petarang - sarang atau tempat tinggal yang usang \n",
    "32. phoghoi - terlalu reput \n",
    "33. pulut - menarik keluar ( berasal dari perkataan Inggeris \" pull out \" ) \n",
    "34. pipir - meleraikan buah dari tangkai\n",
    "35. pughruk - sorokan\n",
    "36. pangkeh - memotong dahan pokok\n",
    "37. palut - bungkus\n",
    "38. poghiso - sedap ( gulai ni tak poghiso ! )\n",
    "39. penanggalan - sama seperti manjangan ( kepala pengamal ilmu hitam yang terbang waktu malam )\n",
    "40. poghrat - rasa yang kurang enak khususnya sayur terung yang telah digulai\n",
    "42. peghajin - seseorang yang sangat rajin bekerja .\n",
    "43. pait - tak mahu\n",
    "44. panggilan - jemputan kawin\n",
    "45. panta - dulang untuk meletak makanan\n",
    "46. pegheh - teruk / susah\n",
    "47. pencong - tak lurus / bengkok\n",
    "48. peta  - fokus mata sebelum membaling sesuatu\n",
    "49. piuh - pintal / cubit\n",
    "50. pocek - komen\n",
    "51. podulik ajab - tidak mengambil endah lagi\n",
    "52. poloso - pemalas\n",
    "53. pomola - lucu / kelakar / lawak\n",
    "54. pomongak - pembohong\n",
    "55. pencolek angek -punca\n",
    "56. ponggit - mengada-ngada\n",
    "57. ponggo - bakar hingga rentung\n",
    "58. pongopan ( belum pongopan lagi ) - sedia\n",
    "59. posuk - berlubang\n",
    "60. pudek / pondot - menyumbat pakaian ke dalam almari yang padat\n",
    "61. puga - tenyeh\n",
    "62. pugeh - main hentam\n",
    "63. pundung - pondok / dangau\n",
    "64. puntang-panting - lari lintang pukang\n",
    "65. \n",
    "\n",
    "\n",
    "\n",
    "\n",
    "      R\n",
    "1.      radak – tikam\n",
    "2.   ronggeng - tarian\n",
    "\n",
    "  \n",
    "\n",
    "    S\n",
    "1.      sodoalah – semua  ( kosodoalah - kesemuanya )\n",
    "2.      songeh – perangai\n",
    "3.      sonak – sakit perut\n",
    "4.      sonsang – sepak / salah / meluru\n",
    "5.      sigai – tangga buluh untuk mengambil air nira\n",
    "6.      sobun – telah tertimbus / tidak boleh dipakai lagi seperti perigi\n",
    "7.      susup – sorokan\n",
    "8.      sontot – pendek atau gemuk\n",
    "9.      sondot – pendek dan gemok\n",
    "10.  siang – bersihkan ikan untuk dibuat gulai\n",
    "11.  sonta - cuci atau kikis pinggan  atau periuk\n",
    "12.  sumpeh / sumpek /  - sumbing ( digunakan ke atas mata parang atau pisau )\n",
    "13.  seykeh – ketuk kepala dengan kepala jari\n",
    "14.  sotai atau kotai – rosak atau buruk\n",
    "15.  songkang – tutup atau tahan dengan sesuatu\n",
    "16.  sungkit – keluarkan sesuatu dari bawah dengan kayu\n",
    "17.  sombam – lemah semacam berpenyakit\n",
    "18.  sugon - menenyeh / menyental muka seseorang ke atas permukaan lantai\n",
    "19.  sokah – dahan patah\n",
    "20.  sodo – seadanya\n",
    "21.  selompap – selonggok\n",
    "22.  sosah – pukul dengan kayu\n",
    "23.  sondat – padat\n",
    "24.  serabai – sejenis makanan bulan puasa diperbuat dari beras / tak kemas\n",
    "25.  sangkak – buluh yang dibelah supaya boleh mengambil buah-buahan\n",
    "26.  sekerap – getah kering dari pokok getah\n",
    "27.  selilit – penuh dengan hutang\n",
    "28.  semumeh - comot di mulut\n",
    "29.  sepicing – tidur sekejap\n",
    "30.  singkek – bangsat / miskin\n",
    "31.  sewat – sambar / rentap\n",
    "32.  sengkelet – sekeh / ketuk biasanya di kepala\n",
    "33.  siniya – di sini\n",
    "34.  senua – di sana\n",
    "35.  sanun – di sana\n",
    "36.  senteng – pendek, contohnya  seluar\n",
    "37.  sewa – ilham / gambaran\n",
    "38.  sampuk – ditegur kuasa ghaib\n",
    "39.  soka – keras dan kering\n",
    "40.  senaja – tidak dapat mengawal basikal turun dari bukit lalu jatuh ke dalam semak\n",
    "41.  sibak - selak ( kain atau langsir )\n",
    "42.  selepot – duduk sambil kedua kaki ke belakang\n",
    "43.  senayan – hari Isnin\n",
    "44.  selemo – hingus\n",
    "45.  sambal gesek – sambal lada\n",
    "46.  songkon – bodoh\n",
    "47.  sungkok-sangkak – merangkak di dalam semak untuk mencari sesuatu.\n",
    "48.  selorau – hujan dengan lebatnya tetapi sekejap\n",
    "49. secoet - sedikit \n",
    "50. sanggo - sambut dengan tangan \n",
    "51. selompap / selopok - menjelaskan bayaran dengan jumlah yang besar \n",
    "52. sebar - luaskan ( dia hendak sebar rumahnya )\n",
    "53. sempong - robek\n",
    "54. seghoman - rupa sama sahaja\n",
    "55. Sandar - sejenis tumbuhan di dalam sawah yang boleh dibuat gulai\n",
    "56. selompar - sebidang kecil tanah\n",
    "57. sede - diabai-abaikan / tak ambil berat /sambil lewa\n",
    "58. siapaleh / chapaleh - minta dijauhkan dari bahaya\n",
    "59. siah - elak\n",
    "60. simbo - simbah dengan air\n",
    "61. sitap - sepet ( mata )\n",
    "62. sobulek - dikumpulkan menjadi satu dalam bekas\n",
    "63. sojak - segak / bergaya\n",
    "64. sokolap - tidur sekejap\n",
    "65. so'eh - kenyang sebab makan\n",
    "66. solala - sama / sefesyen\n",
    "67. solanjar - terus menerus tanpa tersekat atau terhenti\n",
    "68. sonala - pada kebiasaan / selalunya\n",
    "69. senegheh - senonoh / tepat betul\n",
    "70. sengayut - bergayut\n",
    "71. songkalan - batu giling\n",
    "72. sopalit - sikit sangat\n",
    "73. sopah - makan\n",
    "74. songge - sengeh\n",
    "75. songkeh - sangat kenyang\n",
    "76. sontak - hingga / sampai\n",
    "77. sotai - kertas yang hampir hancur dirobek-robek\n",
    "78. sugi - sental\n",
    "79. suki - cukup makan ikut sukatan / keperluan\n",
    "80. stemet - anggaran\n",
    "81. sunu - perbuatan mengarahkan kepala ke arah  suatu tempat\n",
    "82. songkit - terlalu kenyang\n",
    "83. sekoli daro - masakan yang penuh sekuali\n",
    "\n",
    "    T\n",
    "1.      tercanak – tegak\n",
    "2.      teleng – juling\n",
    "3.      terkeluceh – kaki tercedera ketika berjalan\n",
    "4.      toek – kosong ( lempeng toek )\n",
    "5.      tebungkeh – tercabut\n",
    "6.      terkelepot – jatuh dan tak boleh bangun\n",
    "7.      taek – sedap sangat\n",
    "8.      tergolek – jatuh ke tanah\n",
    "9.      tengahari gaego – tengahari tepat\n",
    "10.  terkemama – terkesima / kehairanan\n",
    "11.  tenjot – jalan seperti orang cedera\n",
    "12.  terbeliak – mata terbuka luas\n",
    "13.  tuntong – terbalikkan atau curahkan\n",
    "14.  tongka – degil\n",
    "15.  terjeluek – rasa nak muntah\n",
    "16.  tungka – tumbang\n",
    "17.  tutuh – potong dahan kayu dengan parang\n",
    "18.  teriang – penghujung\n",
    "19.  tupang – sokong dahan daripada jatuh atau patah\n",
    "20.  tesonte – terkeluar sedikit\n",
    "21.  terbungkang – mati dalam keadaan kaki dan tangan ke atas\n",
    "22.  tak terhengkoh – tak terlaksana\n",
    "23.  tersongge – ketawa nampak gigi\n",
    "24.  terkincit – buang air besar sedikit demi sedikit\n",
    "25.  tempolok – perut sendiri\n",
    "26.  tak tegembalo – tak terurus\n",
    "27.  tercaduk – terkeluar\n",
    "28.  tak senereh – tak senonoh\n",
    "29.  tak menureh – tidak cekap atau pandai\n",
    "30.  tak nyonyeh – tak rosak\n",
    "31.  tak semonggah – buat kerja yang tak berfaedah\n",
    "32.  tengkot – jalan tak stabil kerana kesakitan\n",
    "33.  titik – pukul sehingga lumat / rotan\n",
    "34.  terembat – terhantuk \n",
    "35.  tukih – naik\n",
    "36.  tebarai – telah dikelurkan ( dismantle )\n",
    "37.  tercacak  atau  tercanak – lekat pada sesuatu\n",
    "38.  terkiak-kiak – dalam ketakutan sambil menangis\n",
    "39.  tepeleot – tidak dapat bangun kerana cedera\n",
    "40.  terpico – pantang dibiarkan lalu diambil orang\n",
    "41.  terpaco – muncul dengan tiba-tiba\n",
    "42.  toteh – memotong secara memancong\n",
    "43.  tua tau – arif kerana tua\n",
    "44.  toreh – menoreh getah\n",
    "45.  terlurus – lubang mayat  memanjang di tengah-tengah lubang kubur\n",
    "46.  terkelepot – terbaring\n",
    "47.  terbulus – terlepas / jatuh ke bawah\n",
    "48.  terpuruk – tidak dapat keluar dari kawasan berlumpur\n",
    "49.  terpelosok – dalam keadaan yang sukar untuk keluar\n",
    "50.  telayang – hampir nak tertidur\n",
    "51.  ternonok-ternanak  -  berjalan tidak tentu arah lalu tersungkur\n",
    "52.  terbureh – terbuka dan terkeluar\n",
    "53.  terhencot-hencot   -   jalan perlahan dan kelihatan sangat serik\n",
    "54.  tersembam – jatuh ke tanah dengan muka dahulu\n",
    "55.  tirih – bocor\n",
    "56.  tuam – tekan\n",
    "57.  tak belocit – tak berbunyi\n",
    "58.  tokih – hampir   / nyaris\n",
    "59.  talo – bantai / belasah / rotan\n",
    "60.  tempeleng – lempang\n",
    "61.  tokak – selera\n",
    "62.  tetoyek  atau kekorek – lebihan atau kerak rendang dalam kuali\n",
    "63.  togamam – terkejut\n",
    "64.  tarak – tiada\n",
    "65.  terjungkit – ternaik ke atas\n",
    "66.  tak goso dek den yo ! saya malas buat\n",
    "67.  tochlit – lampu suluh ( berasal dari perkataan Inggeris  - torchlight )\n",
    "68.  tak berkotak – tak berbunyi\n",
    "69.  tekulu tekilir – kepercayaan dukun tentang penyakit malaria\n",
    "70.  tak goso – malas nak buat\n",
    "71.  tak diapekkannya – tak diperdulikannya\n",
    "72.  tercirit – tidak dapat mengawal membuang air besar\n",
    "73.  terbuseh –  perut besar yang terkeluar apabila memakai kain\n",
    "74.  tersantak – terlalu hampir\n",
    "75.  toreh-toreh – penting-penting\n",
    "76. telapak - rumah atau tempat tinggal \n",
    "77. tebughai - terkeluar secara tak sengaja\n",
    "78. tercabut - menyerupai \n",
    "79. tobek - paya\n",
    "80. togah dek kau - disebabkan oleh kamu \n",
    "81. togel - tidak berpakaian \n",
    "82. terkeghonyok - rosak atau tercemar\n",
    "83. tak selakuan - tak senonoh \n",
    "84. tang air - anak sungai\n",
    "85. tutuh dek kau - buatlah sesuka hati kamu \n",
    "86. tekelicik - jatuh ke tanah kerana licin\n",
    "87. taruk - bubuh\n",
    "88. taghruh - letak / simpan\n",
    "89. tuang - masukkan atau curahkan air ke dlm sesuatu\n",
    "90. tak suki - tak cukup \n",
    "91. tebar - lepaskan jala ke dalam sungai / mencanai roti\n",
    "92. tinggal lagi - lagipun ( dah lamo dio nak ke mekah tinggal lagi badannya tak sihat )\n",
    "93. terkopak - pecah ( dinding rumah itu telah terkopak )\n",
    "94. terkupek - tercabut ( tapak kasutnya telah terkupek )\n",
    "95. tersonggea - tersenyum lama dan nampak gigi\n",
    "96. tersengeh - tersenyum sahaja\n",
    "97. teleher - tekak atau selera seseorang\n",
    "98. tekau eh ! - kata awak\n",
    "99. tejorang - sedang dimasak\n",
    "100. toboh - tempat ( contoh:  kek mano toboh eh ? ) \n",
    "101. tak senereh - tidak senonoh / serba tidak tahu\n",
    "102. tebelesey - keadaan yang tidak berdaya\n",
    "103. tak kotawanan - tak pasti / ragu-ragu apa yang hendak dibuat\n",
    "104. tandeh - kehabisan\n",
    "105. tak selaku - tak senonoh\n",
    "106. tanjul - ikat\n",
    "107. tebok / tenok - ditanduk oleh lembu\n",
    "108. tenang - menumpu perhatian sebelum menembak atau memanah\n",
    "109. tiek - seliuh ( tak patah tiek )\n",
    "110. timpan - lepat ( sejenis kueh )\n",
    "111. tingkeh - sudah habis\n",
    "112. tobe'eng - sengkak / terlalu kenyang\n",
    "113. toboba - gempar / terkejut\n",
    "114. toboghongau - kudis / luka yang terbuka luas\n",
    "115. toboleghan - hairan\n",
    "116. tobolengot - merajuk / sensitif\n",
    "117. toboleseh - cepat atau mudah merajuk\n",
    "118. tobo'o - perasaan tersangat malu\n",
    "119. tocangok / tocongak - berdiri tiba-tiba tanpa berkata-kata\n",
    "120. toghoghau - terkejut besar\n",
    "121. tojolepot - terduduk\n",
    "122. tokoliak / tokoliek - salah urat kerana tergelincir atau terjatuh\n",
    "123. tokoneneng - berpinar-pinar\n",
    "124. togamang - terperanjat / terkejut\n",
    "125. tojolubuih - terperosok / terbolos ( jatuh ke dalam lubang )\n",
    "126. tokinyam - hendak lagi\n",
    "127. tokolayak - tergelincir\n",
    "128. tokolebak - terkoyak / tersiat\n",
    "129. tokhighap - tumpah\n",
    "130. tokoluceh - terlucut / terlepas\n",
    "131. tokong - sepotong / sekerat\n",
    "132. toledan-ledan - melengah-lengahkan kerja\n",
    "133. tolengkang - terbiar\n",
    "134. tolopo - terleka sekejap / terbuka\n",
    "135. tomoleng - berpaling\n",
    "136. tona - riuh / gegak gempita\n",
    "137. tongging - malu-maluan\n",
    "138. tonggong - besar / tegap\n",
    "139. tongkuluk - kain ikat rambut orang perempuan\n",
    "140. topodok - terbenam dalam\n",
    "141. tosunam - tersungkur muka ke bawah\n",
    "142. totungek - terbali kaki ke atas dan kepala ke bawah\n",
    "143. tughik - pekak\n",
    "144. tumuih - benam / tekan\n",
    "145. tungkun - kayu untuk hidupkan api\n",
    "146. tuntung - memasukan air ke dalam bekas\n",
    "147. tombolang - cerita sebenarnya / tidak baik / busuk\n",
    "148. takek - memauk dengan parang\n",
    "149. telentok - dah nak tidur\n",
    "\n",
    "      U\n",
    "1.      uwan - nenek\n",
    "2.   unggih - gigit\n",
    "3.   uceh - melepas / tak dapat\n",
    "4.   ujo - cari momentum / acah\n",
    "5.   ulit - lembab / pelahan\n",
    "6.   ula-ula - resah gelisah / tidak boleh bangun dengan cepat kerana kaki cram\n",
    "7  . umpok - hak\n",
    "8  . upah serayo - buat kerja sukarela / tanpa bayaran\n",
    "9.   uncah - ganggu atau kacau\n",
    "\"\"\""
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 4,
   "metadata": {
    "scrolled": false
   },
   "outputs": [],
   "source": [
    "words = []\n",
    "for line in additional.split('\\n'):\n",
    "    cleaned = cleaning(line)\n",
    "    if len(cleaned) < 3:\n",
    "        continue\n",
    "    c = cleaning(unidecode(line).split('-')[0]).replace('atau', '/').split('/')\n",
    "    \n",
    "    words.extend([cleaning(i) for i in c])"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 5,
   "metadata": {
    "scrolled": false
   },
   "outputs": [
    {
     "data": {
      "text/plain": [
       "1096"
      ]
     },
     "execution_count": 5,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "len(words)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 6,
   "metadata": {},
   "outputs": [],
   "source": [
    "words.extend(['Dodulu', 'Joki', 'marin', 'Onyang',\n",
    "             'Koporit', 'Longjan', 'Loteng', 'Pangkin',\n",
    "             'Siniya', 'Nangnga', 'Bekecapuih',\n",
    "             'Terkemama', 'Kolinggoman','Comporo'])"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 7,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "875"
      ]
     },
     "execution_count": 7,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "words = [i.lower() for i in words if len(i) > 3]\n",
    "    \n",
    "words = set(words) - malays\n",
    "len(words)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 8,
   "metadata": {},
   "outputs": [],
   "source": [
    "import json\n",
    "\n",
    "with open('negeri-sembilan-words.json', 'w') as fopen:\n",
    "    json.dump(list(words), fopen)"
   ]
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.6.8"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 2
}
